طراحی و پیاده‌سازی یک سیستم بازیابی اسناد چاپی فارسی

نویسنده

  • زهرا بهمنی مربی، مهندسی کامپیوتر، دانشگاه صنعتی خاتم‌الانبیاء بهبهان
چکیده مقاله:

هدف: معرفی، دسته‌بندی، و نقد پژوهش‌‌ها دربارۀ سیستم‌های بازشناسی و بازیابی اسناد چاپی فارسی و پیشنهاد یک سیستم بازیابی اسناد چاپی با رویکردی نو. روش‌شناسی: شیوه‌ای جدید با رویکرد جداسازی، طراحی و سپس پیاده‌سازی شده است. برای آموزش و آزمایش سیستم، پایگاه داده‌ای شامل تصویر 50 صفحه متن فارسی در 5 قلم مختلف فراهم آمد. از نیمی از این داده‌ها برای آموزش و نیمی دیگر برای آزمایش سیستم استفاده شد. یافته‌ها: سیستم‌های بازشناسی یا بازیابی سند چاپی فارسی از یکی از سه رویکرد مبتنی بر جداسازی، مبتنی بر شکل کلی کلمه، و رویکرد ترکیبی پیروی می‌کنند. این پژوهش یک سیستم مبتنی بر جداسازی پیشنهاد و پیاده‌سازی و نتایج ارائه شده است. نتیجه‌گیری: نتایج نشان می‌دهد نظام پیشنهادی، روش مناسبی برای پیاده‌سازی نظام‌های بازشناسی یا بازیابی اسناد فارسی است.

برای دانلود باید عضویت طلایی داشته باشید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

بازیابی بر اساس محتوای اسناد چاپی فارسی

با افزایش کتابخانه های دیجیتال و برای برای دستیابی به هدف ادارات بدون کاغذ تعداد زیادی از کپی ها به دیجیتال تبدیل شده و در سیستم مدیریت اسناد ذخیره شده است. همچنین در حال حاضر میلیون ها سند دیجیتال دائماً بر روی اینترنت از یک نقطه به نقطه ی دیگر منتقل می شوند. اگر چه تکنولوژی پردازش تصویر اسناد می تواند برای تبدیل اتوماتیک تصاویر دیجیتال این اسناد به فرمت متن قابل خواندن به وسیله کامپیوتر با اس...

15 صفحه اول

طراحی و ارزیابی یک سیستم کدکننده/کدگشا برای فشرده سازی تصاویر اسناد متنی چاپی

در این رساله، یک سیستم جامع کدکننده/کدگشا مبتنی بر مدل محتوای مخلوط شده در راستا (mrc) برای فشرده سازی با اتلاف اسناد چاپی و با تأکید بر ویژگیهای رسم الخط فارسی/عربی ارائه می گردد. این سیستم قابل انعطاف (تنظیم) بوده و برای تحقق آن بایستی موارد زیر لحاظ شوند: نیاز به ارتباط مناسب بلوکهای عملیاتی مختلف، روشی برای فشرده سازی تصاویر (متنی) دودویی، روشی برای جداسازی متن از پس زمینه ی آن، فنونی به من...

15 صفحه اول

طراحی و پیادهسازی سیستم یادآور واکسیناسیون کودکان مبتنی بر سرویس پیام کوتاه

Background: Most problems related to quality of care and patient safety are related to human negligence. One of the causes of these problems is forgetting to do something. This problem can be avoided with information technology in many cases. Some forgotten are very important. Among these is failure to comply with vaccination schedule by parents that can result in inappropriate outcomes. In thi...

متن کامل

بازیابی متون چاپی فارسی بر اساس پرس و جوی کلمات

در این پایان نامه روشی جدید برای بازیابی و جستجوی کلمات فارسی از میان متون تصویری فارسی ارائه شده است. همچنین روشی مبتنی بر اندازه و شکل نقاط موجود در مستند پس از آستانه گذاری، جهت تشخیص قلم و اندازه قلم مستندات تصویری فارسی ارائه شده است. روش ارائه شده برای تشخیص قلم از اولین روش هایی می باشد که می تواند با دقت بسیار بالایی اندازه قلم مستند فارسی را هم تشخیص دهد. برای ارزیابی روشهای ارائه شده ...

15 صفحه اول

طراحی و پیادهسازی یک الگوریتم برچسبزنی دستوری کلمات فارسی و تشخیص ساختار گروههای دستوری

این پایان نامه در مورد برچسب زنی کلمات و قطعه بندی عبارات در زبان فارسی می باشد.

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


عنوان ژورنال

دوره 30  شماره 4

صفحات  58- 70

تاریخ انتشار 2020-01-21

با دنبال کردن یک ژورنال هنگامی که شماره جدید این ژورنال منتشر می شود به شما از طریق ایمیل اطلاع داده می شود.

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023